iT邦幫忙

2024 iThome 鐵人賽

DAY 4
0
Python

Python自修系列 第 4

DAY4:爬取文章中的圖片

  • 分享至 

  • xImage
  •  

import requests
from bs4 import BeautifulSoup
import os

# 取得使用者輸入的目錄名稱和網址
folder_name = input("請輸入目錄名稱: ")
url = input("請輸入網址: ")

# 創建目錄
if not os.path.exists(folder_name):
    os.makedirs(folder_name)

web = requests.get(url, cookies={'over18': '1'})
soup = BeautifulSoup(web.text, "html.parser")
imgs = soup.find_all('img')
name = 0    #  設定圖片編號

for i in imgs:
    print(i['src'])
    jpg = requests.get(i['src'])
    # 使用 os.path.join 來建立路徑
    file_path = os.path.join(folder_name, f'test_{name}.jpg')
    with open(file_path, 'wb') as f:
        f.write(jpg.content)
    name += 1

#https://www.ptt.cc/bbs/Beauty/M.1638380033.A.7C7.html
#抓ptt圖

直接執行應該會問你的資料夾就是你直接創一個空的就可以了有抓到照片就會放進去


上一篇
DAY3:增加功能,爬取更多頁面,學習如何處理分頁
下一篇
DAY5:擴展爬蟲功能,保存數據
系列文
Python自修30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言